云平台一键部署【 VibeVoice】长对话式文本转语音模型
VibeVoice 是一个用于从文本生成富有表现力、长篇幅、多说话人对话音频(如播客)的新型框架。它解决了传统文本到语音(TTS)系统中的重大挑战,特别是在可扩展性、说话人一致性和自然话轮转换方面。
VibeVoice 是一个用于从文本生成富有表现力、长篇幅、多说话人对话音频(如播客)的新型框架。它解决了传统文本到语音(TTS)系统中的重大挑战,特别是在可扩展性、说话人一致性和自然话轮转换方面。
最近,微软悄悄把开源的语音生成模型 VibeVoice 全都下架,只留下一个 1.5B 的小模型。
微软 vibevoice 微软vibevoice vibev 2025-09-12 19:02 5
这项由微软研究院的彭志良、俞建伟、王文辉、常耀耀等多位研究人员领导的突破性研究发表于2024年8月,研究成果已在arXiv平台公开发布(论文编号:arXiv:2508.19205v1)。对这项技术感兴趣的读者可以通过微软官方项目页面(aka.ms/VibeVo
语音 微软 vibevoice 微软vibevoice 2025-09-03 19:34 7
想象一下,你手边有个魔法盒子,只需输入一段文字脚本,它就能瞬间吐出长达90分钟的自然对话音频——不止一个声音,而是最多四个不同说话者,语气生动、转折流畅,仿佛真人聊天!这不是科幻电影,而是微软刚刚开源的VibeVoice TTS模型带来的现实革命。
说起语音合成技术,大多数人可能还停留在那种机械化、单调乏味的电脑声音印象中。前几天,微软研究院刚刚推出的VIBEVOICE技术,彻底颠覆了我们对AI语音合成的认知。这项技术最令人震撼的地方在于,它能够一口气生成长达90分钟的多人对话音频,听起来就像真人在进行自
微软刚刚发布了 VibeVoice,它看起来像是对 Google NotebookLM 的严重威胁,而 NotebookLM 目前仍是 AI 播客生成领域的霸主。作为开源模型且体积较小,这看起来是对 Notebook LM 的一个开放挑战。
播客 notebooklm 说话人 ll vibevoice 2025-08-28 07:39 8
AI 自动生成播客早已不是新鲜事,但常见的 AI 播客只局限于几分钟的双人对话,这是因为传统语音生成模型大多基于离散化方法,更擅长生成短句、单一音色、结构规整的语音内容。近日,微软亚洲研究院提出了一种全新的语音生成模型 VibeVoice。该模型采用 next